Например, Бобцов

ПРЕДСКАЗАНИЕ УСЛОВИЙ РЕАКЦИЙ С ПОМОЩЬЮ МЕТОДОВ ГЛУБОКОГО ОБУЧЕНИЯ

Аннотация:

Предмет исследования. Исследован метод предсказания различных свойств химических реакций: тип реакции, подходящие группы растворителей, катализаторов для проведения реакции. В качестве представления реакций рассчитаны разницы молекулярных отпечатков пальцев между продуктами и реагентами с использованием химической библиотеки RdKit. Молекулярные отпечатки пальцев широко используются для предсказания различных свойств молекул. Знание условий проведения реакции необходимо для успешного планирования ретросинтеза. Методы хемоинформатики могут эффективно находить взаимосвязь между реагентами реакции и необходимыми условиями для проведения реакции. При этом уменьшаются затраты времени и ресурсов на определение набора необходимых условий для проведения реакции. Прогноз групп растворителей может значительно улучшить качество моделей и применимость подходов. Метод. В качестве моделей машинного обучения применены LightGBM и нейронная сеть с механизмом выбора признаков Deep Feature Selection. Результаты оценивались с помощью метрики F1. Для обучения и оценки моделей данные были разбиты на химически непохожие части. Для перебора параметров использовалась байесовская оптимизация. Основные результаты. Выполнены эксперименты по предсказанию типа реакции, катализаторов и групп растворителей для проведения реакции. Полученные результаты показали, что на основе разницы молекулярных отпечатков между реагентами и продуктами модели машинного обучения можно предсказывать в среднем с мерой метрики F1: тип реакции MLP = 0,99, катализатор MLP = 0,7 и группу растворителей MLP = 0,68. Работа охватывает значительное количество катализаторов и растворителей. Практическая значимость. Автоматизированное планирование ретросинтеза является одним из актуальных направлений исследований. В ходе планирования составляется последовательность необходимых реакций. Предлагаемый метод может быть применен для выработки рекомендаций возможных группы катализаторов и растворителей и позволяет уменьшить затраты ресурсов и времени на определение необходимых условий реакции.

Ключевые слова:

Статьи в номере